今天加班把困擾已久的Bug都解完,心情放鬆下來就有點懶著打太多字。
截圖自 Coursera "How Google does Machine Learning" 課程
跳過兩節Demo的影片,反正就是介紹Google產品的強大之處。
截圖自 Coursera "How Google does Machine Learning" 課程
這章節的內容大意很明確:
"利用Machine Learning取代無止盡啟發條列式的Rule"
然而內容卻很耐人尋味,Eric這位仁兄提到機器學習是一種對於程式設計的轉變,過去的程式設計是利用各項明確的規則堆疊而成,機器學習帶來的革新,讓這項過程不再是設計一堆規則去達成目的,而是設計出自動化學習的程式,去完成目標。看完這段話,會讓人有點困惑,機器學習是否真的有這麼大的能耐呢?
或許是有的,但或許存在著更多是未知風險,就如許多駭客會攻擊程式漏洞,現在也有許多研究在討論機器學習模型的漏洞。舉例而言,Google翻譯近幾年常常出現一些英翻中卻詞不達意,甚至政治不正確的結果,此外,之前一段時間,各家科技公司都推出聊天機器人上線測試,但往往不到一天就變成了帶有偏見乃至極端主義的機器人,這些都是過於依賴機器學習所帶來的隱憂。
所以未來真的會完全轉向Machine Learning的程式設計嗎?或許在這些顯而易見的弱點還未解決前不太可能,更別說其它不直觀隱藏在算法理論中的陷阱,除此之外,用一位稍微學過數學的人角度來看,當我知道函數的方程式,卻硬要用無數的函數樣本去近似,感覺有點本末倒置?
這章節舉了喝咖啡的例子,去彰顯使用機器學習建構程式的優勢與Heuristic Rules的限制。
讓我突然思考到一件事,除了Base on Data、Base on Rules外,其實傳統科學研究上,還有所謂 Model-Based 的工具在處理問題,也就是在假設情境(符合條件限制)之下,建構出來的模型,通常只要條件符合的狀況,這些工具都能展現非常好的效果,當然,當條件越來越發散、越來越一般化,要模型的建構難度就會不斷提高,精準度也會隨之下降,或許如何在這三者間找出平衡點,會比一味迷信Data萬能更靠譜一點!
才到第四天就快沒動力了...